AI资讯新闻榜单内容搜索-NeurIPS

NeurIPS 2025 Spotlight | NYU提出QSVD，仅数学压缩让模型更轻、更快、更稳

在多模态智能浪潮中，视觉语言模型（Vision-Language Models, VLM）已成为连接视觉理解与语言生成的核心引擎。从图像描述、视觉问答到 AI 教育和交互系统，它们让机器能够「看懂世界、说人话」。

来自主题: AI技术研报

9265 点击 2025-11-17 09:53

NeurIPS 2025｜当AI学会"炒股"：用千个虚拟投资者重现金融市场涌现现象

市场不是机器，而是人群；不是公式，而是故事。TwinMarket让AI学会讲述这些故事。 1994年，美国圣塔菲研究所（Santa Fe Institute）推出了一个野心勃勃的项目：人工股票市场（A

来自主题: AI技术研报

7821 点击 2025-11-16 10:40

NeurIPS Spotlight｜GHAP：把3DGS“剪枝”变成“重建更小的高斯世界”

在三维视觉领域，3D Gaussian Splatting (3DGS) 是近年来大热的三维场景建模方法。它通过成千上万的高斯球在空间中“泼洒”，拼合成一个高质量的三维世界，就像是把一片空白的舞台，用彩色的光斑和粒子逐渐铺满，最后呈现出一幅立体的画卷。

来自主题: AI技术研报

8699 点击 2025-11-15 10:13

NeurIPS 25开新坑：145万个图文对，覆盖八种主流水下理解任务

华中科技大学团队推出首个水下多模态大模型NAUTILUS，支持8种水下场景理解任务，并开源145万图文对的NautData数据集。模型通过视觉特征增强模块解决水下图像模糊和颜色失真问题，性能超越现有模型，恶劣环境下表现更佳。

来自主题: AI技术研报

10750 点击 2025-11-12 17:16

终结Transformer统治！清华姚班校友出手，剑指AI「灾难性遗忘」

大模型「灾难性遗忘」问题或将迎来突破。近日，NeurIPS 2025收录了谷歌研究院的一篇论文，其中提出一种全新的「嵌套学习（Nested Learning）」架构。实验中基于该框架的「Hope」模型在语言建模与长上下文记忆任务中超越Transformer模型，这意味着大模型正迈向具备自我改进能力的新阶段。

来自主题: AI技术研报

7764 点击 2025-11-10 09:56

NeurIPS 2025 Spotlight | 选择性知识蒸馏精准过滤：推测解码加速器AdaSPEC来了

目前，最先进的对齐方法是使用知识蒸馏（Knowledge Distillation, KD）在所有 token 上最小化 KL 散度。然而，最小化全局 KL 散度并不意味着 token 的接受率最大化。由于小模型容量受限，草稿模型往往难以完整吸收目标模型的知识，导致直接使用蒸馏方法的性能提升受限。在极限场景下，草稿模型和目标模型的巨大尺寸差异甚至可能导致训练不收敛。

来自主题: AI技术研报

8276 点击 2025-11-07 14:57

如何自动优化领域任务的提示词？用EGO-Prompt｜NeurIPS 2025

大型语言模型（LLMs）正迅速成为从金融到交通等各个专业领域不可或缺的辅助决策工具。但目前LLM的“通用智能”在面对高度专业化、高风险的任务时，往往显得力不从心。

来自主题: AI技术研报

7829 点击 2025-11-07 10:52

NeurIPS 2025 Spotlight | 你刷到的视频是真的么？用物理规律拆穿Sora谎言

随着生成式 AI（如 Sora）的发展，合成视频几乎可以以假乱真，带来了深度伪造与虚假信息传播的风险。现有检测方法多依赖表层伪影或数据驱动学习，难以在高质量生成视频中保持较好的泛化能力。其根本原因在于，这些方法大都未能充分利用自然视频所遵循的物理规律，挖掘自然视频的更本质的特征。

来自主题: AI技术研报

8985 点击 2025-11-06 09:39

内存直降50%，token需求少56%！用视觉方式处理长文本

在NeurIPS 2025论文中，来自「南京理工大学、中南大学、南京林业大学」的研究团队提出了一个极具突破性的框架——VIST（Vision-centric Token Compression in LLM），为大语言模型的长文本高效推理提供了全新的「视觉解决方案」。值得注意的是，这一思路与近期引起广泛关注的DeepSeek-OCR的核心理念不谋而合。

来自主题: AI技术研报

8863 点击 2025-11-01 09:23

NeurIPS 2025 Spotlight | 让检索、推理真正「合体」的小而强模型，AceSearcher来了

如何让一个并不巨大的开源大模型，在面对需要多步检索与复杂逻辑整合的问题时，依然像 “冷静的研究员” 那样先拆解、再查证、后归纳，最后给出可核实的结论？

来自主题: AI技术研报

7171 点击 2025-10-27 10:52